iT邦幫忙

2023 iThome 鐵人賽

DAY 24
0
AI & Data

圖像生成 AI 的原理與應用系列 第 24

[Day 24] Stable Diffusion Online 使用介紹與試玩紀錄(一)

  • 分享至 

  • xImage
  •  

今天要使用 Stability AI 提供的 Stable Diffusion 模型進行文字到圖像的生成~我們可以使用免費的 Stable Diffusion Online 來測試一下 Stable Diffusion 的圖像生成效果(DreamStudio 有一些更進階的功能,需要付費)。

首先進入到 Stable Diffusion Online 的頁面,並點選 "Get Started for Free"

https://ithelp.ithome.com.tw/upload/images/20231003/20162522sUqY5np97h.jpg

接著就會進入到 Stable Diffusion XL Playground,其中 Stable Diffusion XL 是 Stable Diffusion 模型目前穩定的版本。這裡不只提供從 prompt 產生影像的功能,還可以選擇影像風格,預設是電影風格

https://ithelp.ithome.com.tw/upload/images/20231003/20162522ffvjpjOsf9.jpg

除此之外,點開 "Advanced Options" 還有更多可以進階控制的選項,包括:

  • Random Seed:可以控制影像生成的隨機因子,因此可以重複之前的影像生成結果
  • Guidance Scale:可以控制生成影像和 prompt 多接近,設定越高,模型會越嚴格依照 prompt 產生影像,反之若設定較低,模型會有比較多「發揮創意」的空間
  • Height & Width:可以控制影像的長寬,最大可以到 1024x1024

https://ithelp.ithome.com.tw/upload/images/20231003/20162522nKXnesLz2V.jpg

基本使用

為了能和先前使用 Bing Image Creator 做對照,我們先輸入之前使用過的 prompt "A butterfly with rainbow wings landing on a flower",其他設定都維持預設

產生預設 768x768 大小的影像約需要 30 秒,一次只會產生一張影像,上面會有浮水印,得到的結果如下:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522wGeHaWJRzR.png

相較於在 Bing Image Creator 得到的結果,Stable Diffusion Online 產生的影像比較不符合「彩虹翅膀的蝴蝶」,彩虹的元素被放在背景了,不知道是不是受到寫實風格的影響。除此之外,蝴蝶的翅膀左右不太對稱,角度也比較不自然。

因此以這個 prompt 得到的結果來說,Stable Diffusion Online 產生的結果是比較不如預期的,當然這很可能是剛好選到 Bing Image Creator 擅長而 Stable Diffusion Online 不擅長處理的 prompt。未來或許能考慮找 Stable Diffusion Online 生成效果很好的 prompt,輸入到 Bing Image Creator 看效果是否也能很好~

調整風格

接著,我開始嘗試不同的影像風格,選單有的影像風格非常多,在此我選一些我感興趣的:

sai-anime:動畫風格,以影像品質來說是蠻不錯的,雖然還是將彩虹當成背景
https://ithelp.ithome.com.tw/upload/images/20231003/20162522hbGOYgUOf0.png

sai-digital art:數位藝術風格,蝴蝶和背景的彩虹有點融合在一起了,還落下水滴,非常有趣。另外雖然 prompt 寫的是「一隻蝴蝶」,但模型在背景畫了許多小小的蝴蝶/images/emoticon/emoticon37.gif
https://ithelp.ithome.com.tw/upload/images/20231003/20162522lDoQ375zyA.png

`ads-luxury':奢侈品廣告的風格(?),感覺非常著重影像主體(蝴蝶)的細節,有光澤感,但還是有翅型左右不對襯,和不符合「彩虹翅膀」主題的問題
https://ithelp.ithome.com.tw/upload/images/20231003/20162522cHoIyyvdm0.png

artstyle-abstract:抽象藝術風格,沒什麼解構的感覺,蝴蝶還是蝴蝶,花倒是不見了/images/emoticon/emoticon01.gif
https://ithelp.ithome.com.tw/upload/images/20231003/20162522jKerWnrsvW.png

artstyle-surrealist:超現實主義風格,超脫現實的路線可能讓影像更接近「彩虹翅膀的蝴蝶」的主題,但背景還是硬要有彩虹XD 影像效果算是蠻不錯的
https://ithelp.ithome.com.tw/upload/images/20231003/201625228tGLs0vxMM.png

futuristic-futuristic:未來主義風格據說會比較有科技感和暴力元素,不過畫面一片祥和(?),就是蝴蝶的線條比較僵硬的感覺
https://ithelp.ithome.com.tw/upload/images/20231003/20162522yWF2nFgj0I.png

game-gta:GTA 風格...真的嗎?
https://ithelp.ithome.com.tw/upload/images/20231003/20162522qvkV4At9u4.png

misc-kawaii:可愛風格,可能反映在顏色比較粉嫩,然後蝴蝶尾突特別圓(?)
https://ithelp.ithome.com.tw/upload/images/20231003/20162522l3A9t9Yj8y.png

以上評論博君一笑,僅供參考~/images/emoticon/emoticon37.gif 不過產生不同風格的影像真的蠻好玩的,不小心就進入精神時光屋XD

Seed

指的是用於產生影像的隨機 seed,同樣的 seed 產生的影像理論上會相同,因此能重現結果;而不同 seed 產生的結果就會有一些隨機的變異。接下來就來嘗試看看改變 random seed!

使用和原本相同的 seed 51471563:首先我是用和基本使用時相同的 seed,果然產生一模一樣的影像(連翅膀不對襯的方式都一樣呢~
https://ithelp.ithome.com.tw/upload/images/20231003/20162522n00I8bGGF0.png

接著我隨意選用其他的 seed 70699300:產生的蝴蝶明顯不一樣了,不變的是模型似乎傾向產生粉色的話,然後彩虹去哪裡了?
https://ithelp.ithome.com.tw/upload/images/20231003/201625227Yzm8VsKta.png

我再嘗試另外一個 seed 17972028:影像意義依然相似,但呈現的方式又略有不同
https://ithelp.ithome.com.tw/upload/images/20231003/20162522A1beLZ5Rpc.png

這裡由於有公開我使用的 seed,因此輸入一樣的 prompt,並和我使用一樣的 seed,就能夠得到相同的影像喔~/images/emoticon/emoticon39.gif

調整 Guidance Scale

Guidance Scale 可以調整模型多嚴格的依照 prompt 產生影像,預設為 7.5,越高代表越嚴格,越低則代表越不受 prompt 引導。

調高 Guidance Scale

Guidance Scale = 10:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522s6YhhbgfGL.png

Guidance Scale = 15:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522hzaSuw1qQC.png

Guidance Scale = 20:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522pmHR4z9x3M.png

以目前的 prompt 為例子,Guidance Scale 越高似乎代表彩虹的元素越明顯,但依然不在蝴蝶的翅膀上XD Guidance Scale = 15 的時候,蝴蝶的觸角上還出現小蝴蝶,非常奇妙/images/emoticon/emoticon37.gif

調低 Gaudance Scale

Guidance Scale = 5:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522dJDDK9DeeY.png

Guidance Scale = 2.5:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522DvW6GDGrhW.png

Guidance Scale = 0.5:
https://ithelp.ithome.com.tw/upload/images/20231003/20162522zCv67xxlXg.png

Guidance Scale 調低之後,畫面明顯越趨黯淡,蝴蝶也變得不太成型,最後就變成一團灰樸樸的東西,影像品質是比較不好的。因此使用 Stable Diffusion Online 時,Guidance Scale 不能太低,影像生成效果才會較好~


上一篇
[Day 23] Bing Image Creator 使用介紹與結合 ChatGPT 的組合技
下一篇
[Day 25] Stable Diffusion Online 使用介紹與試玩紀錄(二)
系列文
圖像生成 AI 的原理與應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言